如 何 做 出 道德 的 人 工 智能 体 ? 心理 学 的 视角 
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摘要 : 人 工 智 能 的 飞速 发 展 产 生 了 一 系列 道德 困境 , 如 何 做 出 道德 的 人 工 智能 体 ( 如 
道德 人 工 智能 机 器 人 ) 成 为 了 必须 回答 的 问题 。 本 文 从 心理 学 视角 探 完了 人 工 智 能 
体 是 否 可 能 被 赋予 道德 地 位 、 被 如 何 赋予 何 种 道德 地 位 ; 人 工 智能 体 是 否 需 要 及 需 
要 何 种 道德 能 力 ; 人 工 智能 体 如 何 获得 及 获得 何 种 道德 规则 ; 人 工 智 能 体能 够 如 何 
深化 人 类 对 于 人 性 、 关 系 以 及 多 样 化 的 道德 理解 等 多 种 问题 进行 了 回答 。 从 心理 学 
的 理论 和 实证 研究 出 发 ， 切 实 回答 如 何 做 出 道德 的 人 工 智 能 体 的 疑问 ， 期 望 对 以 人 
为 中 心 的 人 工 智能 研究 提供 道德 心理 学 智慧 。 
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= 一 、 人 工 智能 体 的 道德 地 位 (moral standing) 

(一 ) 人 工 智 能 体 需要 道德 地 位 吗 ? 

日 常生 活 中 ， 无 论 是 朴素 民众 〈folk people) 还 是 处 于 人 工 智 能 研究 顶尖 浪潮 上 的 科学 
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家 ， 都 询问 出 类 似 问 题 :“ 如 何 做 一 个 道德 的 机 器 或 机 器 人 或 人 工 智 能 体 ? ”( 虽 然 人 工 智 能 
可 能 只 是 底层 的 计算 或 者 是 代码 , 但 是 本 文 所 指 人 工 智 能 体 包 括 人 工 智 能 程序 、 人 工 智 能 应 
用 、 人 工 智能 机 器 、 人 工 智 能 机 器 人 等 ,我 们 在 本 文中 采用 “人 工 智 能 体 ” 来 代表 所 有 这 些 人 
工 智 能 实体 )。 但 从 语言 学 上 分 析 ， 当 他 们 问 出 这 样 的 问题 时 , 他 们 已 然 承 认 机 器 、 机 器 人 、 
或 者 人 工 智 能 体 具 有 道德 地 位 。 亦 即 ， 人 类 普遍 有 一 种 想 要 赋予 人 工 智 能 体 道 德 地 位 的 朴素 
倾向 ， 尤 其 是 ， 当 人 类 知觉 、 注 意 并 意识 到 人 工 智能 体 其 智能 Cintelligence) 或 者 其 进行 具 
体 事 务 的 能 力 (competence) 要 远 胜 于 自己 时 ， 人 们 更 可 能 赋予 人 工 智 能 体 道德 地 位 (Gray, 
Gray, & Wegner, 2007)。 作 为 美好 的 愿景 ， 我 们 希望 那些 智能 和 能 力 远 胜 于 人 类 的 人 工 智 能 
体 ， 它 可 以 是 道德 的 。 
这 样 说 , HER ASR DE LEAP RENN, MAKEA WER, RE ATH fe 
不 道德 的 。 我 们 无 法 排除 这 种 可 能 ， 出 于 对 人 类 物种 的 中 心 主义 和 自尊 ， 人 类 通常 情况 下 会 
在 除去 智能 和 能 力 的 其 他 方面 对 人 工 智 能 体 进 行 贬损 。 从 社会 认 知 观 的 角度 上 来 看 ， 人 类 认 
识 世界 通过 两 个 基本 维度 : 一 日 能 力 〈( 即 我 们 这 里 所 讨论 的 智能 和 处 理 具 体 事务 的 能 力 )， 
日 温暖 ( 即 进行 良好 社会 交往 和 道德 的 水 平 ) (Cuddy, Fiske, & Glick, 2008)。 如 果 能 力 上 
能 贬损 人 工 智 能 体 , 那么 人 类 倾向 于 在 温 暧 上 贬损 它们 , 最 常见 的 是 倾向 于 认为 它们 没有 
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这 是 这 个 阶段 人 类 认识 上 较为 可 笑 的 矛盾 。 他 们 一 方面 外 显 地 认为 机 器 、 机 器 人 或 者 人 
工 智能 体 没 有 道德 地 位 ， 另 一 方面 他 们 又 内 隐 地 、 悄 无 声 县 地 、 不 由 自主 地 、 未 经 控制 地 存 
有 将 人 工 智能 体 作 为 一 个 具有 道德 地 位 的 道德 实体 的 判断 。 试 想 一 下 如 下 场景 : 一 位 正在 打 
字 ， 写 着 学 术 论 文 的 哲学 教授 ， 一 边 写 下 类 似 :“ 人 工 智 能 无 论 如何 强 大 、 如 何 智 慧 、 如 何 
有 了 能力， 都 改变 不 了 其 所 属 的 工具 地 位 ， 它 永远 不 可 能 成 为 承担 道德 责任 的 主体 ， 也 永远 不 
可 能 享有 道德 权利 与 义务 ， 总 而 言 之 ， 它 不 具有 道德 地 位 ”。 而 这 时 他 的 孩子 被 他 家 的 扫地 
机 器 人 飞驰 而 过 撞 伤 了 腿 , 他 扔 下 论文 , 抄 起 扫地 机 器 人 便 砸 在 地 上 , 爷 念 不 平地 轨道 :“ 讨 
大 的 死机 器 人 、 坏 机 嚣 人， 我 一 定 要 惩罚 你 ”( 王 银 春 , 2018)。 这 样 的 情境 不 应 该 只 是 笔者 
腾 想 出 来 的 , 笔者 相信 读者 但 几 读 到 此 处 , 脑 中 都 有 类 似 场 景 鲜 活 的 画面 感 ， 而 不 会 觉得 陌 
生 。 举 这 个 例子 就 是 想 说 明 , 在 人 类 认识 上 对 于 人 工 智能 体 其 道德 地 位 存在 内 隐 和 外 显 的 分 


离 。 
人 类 对 人 工 智 能 体 在 道德 地 位 上 存在 认识 的 内 隐 外 显 分 离 当然 不 是 一 件 好 事 , 解决 分 离 
的 途径 便 是 达成 一 致 。 内 隐 和 外 显 并 不 是 一 个 连续 维度 上 的 两 个 极 ， 它 就 是 一 个 二 分 的 、 要 
么 内 隐 要 么 外 显 的 维度 ,因此 车 要 达成 内 隐 和 外 显 认识 上 的 统一 ， 人们 要 么 在 认识 上 取消 人 
工 智能 体 的 道德 地 位 , 要 么 在 认识 上 赋予 人 工 智 能 体 道德 地 位 。 究 竟 是 取消 还 是 赋予 它们 道 
德 地 位 ， 这 取决 于 人 工 智 能 体 是 否 可 能 作为 一 个 道德 的 实体 (Entity) 而 主动 地 、 自 发 地 、 
有 意图 地 、 能 动 性 地 去 进行 具有 道德 章 涵 的 行为 。 在 现在 这 个 时 代 和 阶段 里 ， 它 们 似乎 不 可 
能 ， 即 使 它们 做 出 了 某 种 行为 ， 而 这 种 行为 又 伤害 了 其 他 生命 体 ,， 它们 在 人 们 的 推断 中 也 不 
可 能 是 主动 的 、 有 意图 的 、 ae. 自 为 的 、 受 自己 控制 的 。 因 为 现 阶段 的 人 工 智 能 体 并 未 
发 展 到 机 器 或 机 器 人 能 够 有 意图 地 自发 行动 的 程度 ,就 这 个 时 代 这 样 的 人 工 智能 发 展 水 平 来 
取消 人 工 智 能 的 道德 地 位 是 合理 的 。 但 人 工 智能 的 发 展 是 否 永远 不 可 能 发 展 出 有 意图 的 、 自 
主 的 道德 机 器 人 ,这 是 存在 疑问 的 。 哪怕 有 极 小 的 可 能 ， 某 一 天 一 个 能 够 自由 决定 其 行为 的 
人 工 智能 体 出 现 ， 取 消 它 的 道德 地 位 都 是 不 可 以 的 。 从 这 个 意义 上 说 ， 对 人 工 智能 体 的 道德 
地 位 至 少 持 有 一 种 相当 保守 的 态度 , 即 哪怕 现在 其 不 具有 道德 地 位 的 先 在 假设 , 而 赋予 其 道 
德 地 位 以 匹配 人 类 内 隐 的 认 知 观 ， 这 都 是 合理 的 。 


(=) 如 何 赋予 人 工 智 能 体 道 德 地 位 ? 


= 假使 我 们 赋予 了 人 工 智 能 体 以 道德 地 位 , 那 我 们 便 必 须 操 作 化 地 来 说 , 在 具体 情境 中 它 
e 会 与 没有 被 赋予 道德 地 位 的 人 工 智 能 体 有 何不 同 。 当 然 ， 从 推论 上 来 说 ， 这 需要 人 类 在 心灵 
© ms ?能 体 至 少 是 有 意图 的 。 在 具体 行为 层面 上 ， 人 们 则 会 给 被 赋予 了 道德 地 位 的 人 


智能 体 以 道德 权利 和 义务 。 同 时 ， 其 还 必须 承担 道德 责任 。 换 名 话说 ， 即 人 类 将 这 种 人 工 
(moral circle; Singer, 2001; 喻 丰 , 许 丽 颖 ,2018) 中 ， 给 予 人 工 智 
能 体 以 道德 考量 ， 关 心 人 工 智 能 体 作为 一 个 行为 发 出 者 或 者 一 个 行为 的 接受 者 的 道德 意 涵 。 
一 方面 ， 人 工 智 能 体 需 要 获得 道德 权利 和 义务 。 几 年 前 ， 谷 歌 机 器 狗 被 研究 人 员 或 是 普 

通 民众 用 脚 踢 的 视频 在 网 络 上 被 大 量 传播 , 中 国 也 有 研究 人 员 号 称 做 出 了 机 器 狗 , 在 测试 其 
行走 稳定 程度 时 ， 其 方式 也 是 用 脚 足 它 的 身体 ， 而 它 在 跟 哈 之 后 还 能 重新 保持 平衡 ,继续 行 
XE « 这样 的 视频 得 以 传播 的 原因 并 非 是 人 们 赞叹 人 工 智 能 技术 的 先进 发 展 , 而 是 人 们 对 机 器 
e JP Y NUES US. 并 对 研究 人 员 产 生 谴责 或 襄 责 的 倾 回 。 这 体现 了 前 面 所 述 人 类 对 人 工 智 
一 能 体内 隐 的 道德 立场 , 不 自觉 地 赋予 了 人 工 智能 体 以 道德 权利 , 把 人 工 智能 体 当 成 了 有 机 生 
命 体 来 看 待 。 机 器 狗 被 当成 有 机 生命 体 是 可 能 的 ， 因 为 其 毕竟 有 大 量 拟 人 化 的 成 分 在 ， 其 四 
肢 和 躯干、 其 行动 模式 都 在 拟人 (Phillips, Zhao, Ullman, & Malle, 2018 ) 。 我 们 这 里 说 的 拟人 
不 仅仅 指 人 ， 还 包括 动物 等 其 他 生命 体 。 试 想 上 文 所 说 的 扫地 机 器 人 ， 它 会 内 隐 地 被 赋予 道 
德 权利 吗 ? 似乎 不 会 ， 但 我 们 却 可 以 把 它 当 成 道德 对 象 来 谴责 。 也 就 是 说 ， 扫 地 机 器 人 至 少 
在 现在 这 个 发 展 阶段 我 们 不 会 关心 其 情绪 、 情 感 、 心 理 状态 , 我 们 不 会 因为 其 所 处 的 痛苦 而 
悲愤 异常 、 伤 心 流泪 。 主 要 原因 是 扫地 机 器 人 只 是 一 个 圆 盘 形 状 、 其 行动 轨迹 也 与 其 他 生命 
体 大 相 径 庭 ， 甚 至 看 起 来 普通 民众 并 不 能 理解 它 是 一 个 人 工 智 能 机 器 ， 而 仅仅 把 它 当 机 器 。 
若 要 赋予 人 工 智能 体 以 道德 地 位 , 则 其 道德 权利 和 义务 无 论 在 任何 情况 下 , 哪怕 其 外 观 不 似 
人 类 ,哪怕 其 内 在 只 是 算法 , 我 们 都 应 记 住 它们 可 以 是 道德 的 对 象 。 我 们 理应 以 道德 圈 内 之 
物 对 其 施加 道德 考量 ， 对 其 受到 的 伤害 和 痛苦 予以 减少 、 痛 感情 绪 。 
另 一 方面 ,人工 智能 体 若 被 赋予 道德 地 位 ， 其 也 应 该 担负 道德 责任 。 研究 发 现 ， 若 自动 

芍 驶 汽车 处 于 一 个 道德 考量 中 ,面临 一 种 需要 杀 一 救 五 或 者 杀 一 救 多 , 而 杀 的 这 个 “一 ”是 自 
动 驾驶 汽车 的 主人 的 话 ， 人 们 只 会 将 很 少 的 道德 责任 归结 于 这 辆 无 人 轨 驶 汽车 ,而 大 多 数 人 
认为 应 该 杀 一 救 五 ， 但 大 多 数 人 都 倾向 于 不 去 购买 这 辆 无 人 轨 驶 汽车 (Bonnefon, Shariff, & 
Rahwan，2016)。 人 笔者 自己 的 研究 也 发 现 ， 如 果 一 辆 智能 汽车 突然 失灵 、 开 始 鸣 笛 ， 鸣 笛 的 


声音 伤害 了 正 从 超市 出 来 经 过 这 辆 汽车 的 一 个 被 母亲 推 在 摇篮 中 的 孩子 的 听力 , 那么 人 们 在 
归 责 时 倾向 于 将 更 多 的 道德 责任 归结 为 设计 这 辆 智能 汽车 的 程序 员 、 生 产 商 、 售 卖 商 甚至 这 
位 母亲 ， 而 将 很 少 的 道德 责任 归结 为 是 这 辆 汽车 所 为 〈 邬 家 骅 ， 喻 丰 ,， 许 丽 颖 , 2016)。 两 个 
实验 都 发 现 了 同样 的 效应 , 即 人 们 实际 上 很 少 会 将 道德 责任 归结 为 人 工 智能 体 , 但 值得 指出 
的 是 ， 人 们 并 不 是 完全 不 把 道德 责任 归结 为 它们 。 我 们 不 倾 癌 于 给 人 工 智 能 体 归 责 ， 是 因为 
在 人 类 归 因 的 规律 上 ， 存 在 一 种 所 谓 的 基本 归 因 错误 (Fundamental Attribution Error, FAE; 
Ross, 1977)， 即 我 们 倾向 于 将 行为 的 原因 归结 于 行为 人 本 身 ， 而 非 除 人 之 外 的 其 他 一 切 ， 比 
如 情境 。 一 个 被 赋予 了 道德 立场 的 人 工 智 能 体 必然 是 能 够 承受 道德 责任 的 行为 主体 , 在 认识 
上 和 人们 倾向 于 让 其 负 少 量 责任 , 这 也 许 也 因为 这 个 时 代 的 人 工 智 能 发 展 让 人 不 那么 容易 将 其 
作为 道德 主体 看 待 , 而 若 要 赋予 其 道德 立场 , 我 们 需 将 其 作为 一 种 特殊 的 道德 实体 来 类 比 于 
人 或 动物 形成 对 其 进行 道德 责任 归 因 或 者 是 道德 谴责 、 道 德 表 扬 的 独特 模式 。 
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(=) 赋予 人 工 智 能 体 何 种 道德 地 位 ? 

上 述 讨论 我 们 举 了 两 例 , 分 别 是 一 个 受 虐待 的 人 工 智 能 体 和 一 个 需要 承担 道德 责任 的 人 
工 智 能 体 , 用 以 说 明 一 个 具有 道德 地 位 的 人 工 智能 体 至 少 在 人 的 认识 论 上 如 何 体现 其 道德 地 
位 。 从 心智 知觉 (mind perception ) 理论 来 看 , 道德 立场 就 区 分 为 两 种 : 一 者 为 道德 客体 (moral 
patient)， 一 者 为 道德 主体 (moral agent) (Gray, Young, & Waytz, 2012 )。 道 德 客 体 是 这 个 道 
德 一 对 概念 中 行为 的 接受 者 , 它 引 起 人 类 的 同情 等 情感 反应 , 正如 上 文 所 说 被 踢 的 机 器 狗 一 


o 样 。 道 德 主 体 是 这 个 道德 一 对 概念 中 行为 的 发 出 者 , 它 承 担 行为 产生 后 果 所 带 来 的 道德 责任 ， 
© 正如 上 文 所 说 损伤 了 孩子 听力 的 智能 汽车 一 样 。 


对 道德 客体 所 承受 痛苦 的 体验 experience) 更 好 理解 。 道 德 涉及 伤害 (Haidt, 2007). 
正如 宠物 被 伤害 与 孩子 被 伤害 ， 人 所 激 起 的 生理 机 体 反 应 相似 , 我们 推测 ， 若 人 工 智能 体 受 
到 伤害 ， 人 的 反应 应 该 在 质 上 与 人 或 动物 受到 伤害 无 异 ， 也 许 存 在 量 上 的 区 别 。 但 这 一 观点 
也 不 绝对 ， 因 为 人 工 智 能 体 毕 竞 不 是 有 机 体 ， 即 使 作为 有 机 体 的 植物 受到 伤害 (如 人 砍伐 树 
木 、 躁 足 花 条 )， 人 们 对 其 的 反应 是 否 与 对 人 或 者 对 动物 相同 ， 这 是 尚 待 探讨 的 问题 。 更 似 
论 非 有 机 体 ， 研 究 发 现 ， 对 于 在 纯净 的 雪山 上 和 钉 钉 子 这 种 类 似 伤 害 雪 山 的 行为 ， 人 们 不 倾向 
于 将 其 看 做 伤害 ， 而 倾向 于 将 其 看 做 对 纯洁 的 污染 〈Frimer, Tell, & Haidt, 2015)。 因 此 作为 
om 非 有 机 体 的 人 工 智 能 体 如 若 受 到 伤害 , 人 们 将 作 何 反应 首先 在 于 人 们 将 其 是 否 看 做 人 或 者 类 
一 人 的 生物 ， 当 然 这 取决 于 人 工 智 能 体 本 身 的 特征 和 人 们 所 处 的 情境 。 作 为 道德 客体 ， 人 们 对 
人 工 智 能 体 受 到 伤害 的 反应 似乎 还 需要 更 多 的 研究 。 

对 道德 主体 所 需 承担 责任 的 判断 要 更 为 复杂 。 以 现在 人 工 智 能 的 发 展 来 看 ， 人工 智能 体 
实际 上 是 披 着 外 壳 的 算法 。 如 果 是 这 样 的 话 ,， 那么 这 件 事情 将 变 得 相当 复杂 。 如 若 这 个 人 工 
智能 体 无 法 自动 进行 后 续 的 学 习 和 迭代 , 那么 这 种 人 工 智能 体 将 保持 其 出 三 时 被 程序 员 所 设 
计 的 样子 。 这 种 人 工 智 能 体 是 否 会 被 当成 道德 主体 ， 人 们 在 考量 时 理应 是 存疑 的 。 因 为 其 所 
进行 的 行为 均 由 己 有 程序 或 者 基于 其 训练 库 所 产生 的 算法 来 决定 。 理 论 上 来 说 , 将 责任 归结 
于 设计 其 算法 的 程序 员 或 者 所 使 用 的 训练 材料 似乎 更 为 合理 。 在 这 个 意义 上 , 这 样 的 人 工 智 
能 体 也 许 在 实践 中 只 能 被 少量 地 进行 道德 责任 归 因 ( 喻 丰 , VENA, 2019)。 如 若 这 个 人 工 智 
能 体 是 有 自主 学 习 能 力 的 , 它 可 以 根据 使 用 者 具体 使 用 的 经 验 不 断 学 习 迭 代 ( 如 各 种 可 训练 
的 聊天 机 器 人 )， 那 么 对 其 的 道德 责任 归 因 应 该 更 复杂 。 比 如 车 聊天 机 器 人 在 设计 时 只 是 可 
以 进行 基本 的 日 常会 话 ， 但 是 在 经 过 与 各 种 人 大 面积 的 聊天 之 后 ， 它 学 会 了 对 女性 的 歧视 。 
那么 这 种 不 道德 的 行为 应 该 归 钻 于 谁 ? 是 设计 它 的 程序 员 ? 是 那些 训练 它 的 、 和 它 聊天 的 人 ? 
还 是 这 个 聊天 机 器 人 本 身 ? 这 就 如 同 孩 子 模 仿 暴 力 电影 中 的 情节 而 杀人 , 我 们 会 把 多 大 的 责 
任 归结 于 电影 呢 ? 当然 ,这 种 道德 责任 归 因 还 需要 考虑 人 工 智能 体 本 身 的 特征 《如 拟人 化 程 
度 等 )、 甚 至 更 为 宏大 的 社会 文化 背景 (如 中 国人 更 倾向 于 向 外 归 因 等 )〈 彭 凯 平 ， 廖 江 群 ， 


2009)。 但 对 类 似 问 题 的 探索 至 少 在 现在 似乎 还 没有 答案 。 


二 、 人 工 智 能 体 的 道德 能 力 (moral competence) 

(一 ) 人 工 智 能 体 是 否 需要 道德 能 力 ? 

如 果 人 工 智 能 体 被 赋予 了 道德 立场 ,那么 其 是 否 真 的 具有 可 以 进行 自主 道德 判断 和 行为 
的 能 力 便 更 为 重要 。 现 有 的 人 工 智 能 体 应 该 说 都 缺乏 这 种 道德 判断 和 进行 道德 行为 的 能 
正如 图 灵 测 试 (Turing test) 作为 一 种 判断 人 工 智能 的 古老 标准 一 样 ， 所 谓 道德 图 灵 测 试 
(Moral Turing Test, MTT) 也 被 提出 用 以 检验 人 工 智 能 体 是 否 具 有 道德 能 力 (Wallach & 
Allen，2008)。 围 绕道 德 图 灵 测 试 的 争论 很 多 ， 笔 者 不 再 歼 述 ， 就 现 有 观点 来 看 ， 道 德 图 灵 
测试 并 非 是 一 个 理论 完备 、 方法 可 靠 、 易于 操作 的 客观 标准 ， 正 如 图 灵 测 试 都 很 难 真 的 测试 
人 工 智 能 , 道德 图 灵 测 试 也 保留 有 极 强 的 心理 学 行为 主义 刺激 与 反应 联结 的 观点 (Amold & 
Scheutz, 2016 )。 

行为 主义 观 虽 然 在 人 工 智能 领域 应 用 甚 广 , 但 从 人 类 心理 发 生 、 发 展 、 变 化 规律 的 角度 
看 ， 它 极为 忽视 人 类 心理 具体 的 运作 规律 ， 以 现代 心理 学 的 角度 ， 它 是 被 抛弃 的 传统 理论 。 
代 之 以 行为 主义 的 无 论 是 精神 分 析 、 人 本 主义 还 是 认 知 主义 , 都 强调 人 心 具 体 运作 的 内 部 过 
程 。 虽 然 深度 学 习 也 采用 神经 网 络 模型 ， 但 从 心理 学 的 角度 来 看 ， 这 是 底层 的 、 非 心理 化 地 
展示 人 类 心理 运作 黑箱 的 过 程 。 真 正 有 心理 学 意 列 的 过 程 并 非 生 物 过 程 ， 当 然 ， 也 并 非 最 底 
== 层 的 算法 过 程 , 它 可 能 是 基于 生物 和 算法 之 上 的 心理 变量 的 运作 模式 。 做 出 道德 判断 和 道德 
e 行为 必须 要 求人 或 者 人 工 智 能 体 有 能 做 出 这 类 判断 和 行为 的 能 力 , 同时 要 求 其 有 做 出 这 类 判 
© 断 和 行为 的 动机 与 倾向 。 能 力 、 动 机 、 倾 向 都 是 算法 和 生物 过 程 之 上 的 心理 过 程 。 道 德 能 力 
至 少 是 动机 、 倾 向 之 前 的 变量 , 没有 道德 能 力 ， 无所谓 动机 或 者 倾向 ， 因 为 缺乏 能 力 便 缺 乏 
做 出 道德 判断 和 能 力 的 可 能 ( 喻 丰 ， 韩 婷 婷 , 2018)。 因 此 ， 人 工 智 能 体 若 要 满足 人 类 的 需求 
和 期 望 ， 它 必须 具有 道德 能 

但 对 人 工 智能 体 是 否 具 有 道德 能 力 的 判断 明显 不 应 该 通过 某 种 情境 看 其 是 否 在 进行 道 
德 判 断 时 能 够 以 假 乱 真 地 骗 过 人 类 〈 即 所 谓 的 道德 图 灵 测 试 )。 这 种 测试 以 先进 的 心理 学 观 
看 来 更 像 是 拌 机 灵 式 的 、 相 对 幼稚 的 寻求 捷径 。 道 德 能 力 是 否 具有 ， 应 该 看 道德 能 力 本 身 ， 
而 不 应 转 而 以 某 种 类 似 预 测 效 度 的 方式 去 考量 。 如 果 非 要 以 拐弯 的 方式 去 考察 , 那 只 能 是 因 
为 无 法 考察 道德 能 力 本 身 。 诚然 , 道德 能 力 的 获得 以 及 道德 能 力 的 高 低 也许 有 不 同 的 获得 方 
式 : 自 上 而 下 抑或 是 自 下 而 上 。 但 无 论 何 种 方式 获得 ， 道 德 能 力 应 该 也 是 一 种 或 多 种 实体 ， 
可 以 直接 考量 CMalle, 2014). 
日 需要 说 明 的 是 ,道德 能 力 (moral competence) 是 否 是 人 工 智 能 体能 力 (competence) 
的 一 种 ?如 果 用 社会 认 知 的 观点 来 看 ,道德 与 能 力 是 相对 的 ， 甚 至 在 人 的 认识 论 上 ， 某 种 程 
度 二 者 还 是 此 消 彼 长 有 种 零 和 感觉 的 .从 这 个 意义 上 讲 , 道德 能 力 看 似 是 个 有 矛盾 的 词语 。 
但 是 将 能 力 之 前 冠 以 道德 ， 是 在 强调 能 力 。 以 笔者 看 来 ， 道 德 能 力 确 是 能 力 的 一 种 ， 是 那些 
能 够 用 以 帮助 做 出 道德 判断 和 道德 行为 的 特定 能 力 , 正如 功能 型 的 机 器 人 有 其 功能 型 的 能 力 
(如 举重 机 器 人 有 能 承受 巨大 的 重量 并 将 其 托 起 的 能 力 ) 一 样 。 
晶 是 ,一 个 道德 能 力 强 的 人 工 智能 体 是 否 一 般 性 的 能 力 都 强 呢 ?” 以 及 一 个 一 般 性 能 力 强 
的 人 工 智能 体 是 否 道德 能 力 强 呢 ?这 问题 类 似 心理 测量 学 的 信和 度 与 效 度 关系 , 一 者 包括 于 男 
一 者 , 但 并 不 一 定 对 应 增长 。 从 这 个 时 代 人 工 智 能 的 发 展 浪潮 来 看 ， 人 们 倾向 于 去 制造 那些 
一 般 性 能 力 强 或 者 是 功能 性 能 力 强 的 人 工 智能 产品 , 而 忽视 其 道德 能 力 。 人 工 智 能 体 道德 能 
力 的 建设 要 远 远 困难 于 其 功能 性 能 力 。 可 以 试想 如 若 一 个 一 般 性 能 力 极 强 , 具有 极 高 智能 的 
机 器 人 缺乏 道德 能 力 的 设 定 , 其 道德 能 力 是 在 其 进行 事务 和 社会 活动 时 所 自行 习 得 的 ， 那么 
它 有 可 能 获得 在 人 类 看 来 完全 错误 的 道德 规则 , 产生 与 人 相悖 的 道德 情感 ,进行 非 人 化 的 道 
德 判 断 和 行为 , 这 是 我 们 不 愿 看 到 的 。 由 于 对 道德 能 力 的 研究 无 论 是 其 难度 还 是 完成 度 都 要 


困难 于 对 人 工 智 能 体 一 般 能 力 的 研究 , 因此 笔者 建议 在 人 工 智 能 体 缺 乏 道德 能 力 的 当下 , 不 
应 急于 追求 其 一 般 能 力 ， 或 日 其 智能 
(=) 人 工 智能 体 需要 何 种 道德 能 力 ? 

力 ， 那 么 其 道德 能 力 是 什么 ， 这 涉及 到 对 道德 能 力 的 分 类 。 


一 种 广泛 的 观点 认为 ， 道 德 能 力 包括 以 下 五 种 材料 : 规范 系统 、 道 德 词 汇 系统 、 道 德 认 知 和 
情感 、 道 德 决策 和 行为 、 道 德 交 流 (Malle, 2014). 

第 一 ， 道 德 规范 。 谁 都 能 理解 道德 规范 的 内 容 ， 但 似乎 谁 也 不 能 完整 地 说 出 道德 规范 具 
体 是 什么 、 有 哪些 。 在 日 常生 活 中 ,我 们 根据 道德 规范 来 判断 一 个 行为 是 对 或 错 ， 但 我 们 也 
并 不 清楚 这 种 判断 所 依据 的 原因 究竟 有 多 少 个 , 它们 是 如 何 归 类 的 。 如 果 我 们 很 难 清楚 这 
点 ， 程 序 员 在 编程 时 就 很 难 将 这 些 规则 表征 为 可 供 机 器 识别 和 应 用 的 规 条 ,也 无 法 说 明 这 些 
规 条 有 具体 在 何 种 条 件 下 起 作用 。 对 于 道德 规范 的 探讨 ,我们 还 将 在 后 一 个 部 分 进行 详细 的 阐 
述 。 
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第 二 ， 道 德 词 汇 。 道 德 规范 系统 必须 有 语言 和 算法 的 表征 ， 之 前 研究 认为 ， 道 德 词汇 系 


统 至 少 包 括 三 个 方面 : 规范 及 其 属性 的 词汇 (如 公平 、 美 德 、 互 惠 、 诚 实 、 责 任 、 禁 止 、 应 
> 该 等 )、 规 范 违反 的 词汇 (如 错误 、 有 罪 、 鲁 医 、 窃 贼 ， 也 包括 有 意 、 故 意 等 )、 对 违反 做 出 
N 反应 的 词汇 〈 如 责备 、 训 斥 、 原 谅 、 宽 恕 等 )。 这 些 词汇 构成 了 狭义 上 道德 规范 表征 、 广 义 
EM 上 道德 能 力 的 基本 骨架 (Malle, 2014)。 如 研究 发 现 ， 进 行道 德 批判 实际 上 只 需要 一 个 两 维 
© 度 、28 个 动词 的 词语 系统 。 这 两 个 维度 是 强度 和 人 际 ， 这 28 个 词 分 别 是 ， 控诉 、 指 责 、 批 
© 评 、 XA. BOd. DOR. Gu. Fh. MES Beat. de. Ux. dedu. WEURD CUR. HESS. 
um ZR YA. Mal AR Ups. PER QE. EUR. a RT vi. 侮辱 、 责 难 、 声 讨 (Voiklis, Cusimano, 
CO & Malle, 2014)。 值 得 说 明 的 是 ， 当 我 们 把 这 28 个 词 翻译 成 中 文 时 ， 其 意义 也 许 并 不 一 一 对 


应 ， 若 用 中 文 词汇 来 建构 道德 批判 ， 可 能 形成 的 是 不 尽 相 同 的 语词 结构 。 这 也 提示 我 们 ， 在 
道德 能 力 的 建构 上 ， 仅 从 语言 学 角度 便 存在 文化 差异 。 
第 三 , 道德 认 知 和 情感 。 道德 认 知 主要 涉及 对 人 工 智 能 体 的 道德 判断 ,但 这 种 判断 似乎 
可 以 粗略 地 首先 分 为 两 种 : 对 事件 的 判断 或 者 对 行为 主体 的 判断 。 对 事件 的 判断 包括 评价 事 
牛 、 行 为 、 行 为 结果 是 好 是 坏 、 是 错 是 对 、 是 否 可 允许 等 。 对 行为 主体 的 判断 包括 评价 其 是 
否 应 负 道 德 责任 、 是 否 值得 被 责备 或 赞扬 (Malle & Scheutz, 2014)。 当 然 ， 道 德 认 知 或 日 道 
德 判断 离 不 开 情 感 , 这 是 自 休 席 以 降 直 至 上 世纪 末 、 本 世纪 初 才 在 心理 学 中 复兴 的 一 种 情感 
EM ORE, KIF, 韩 婷 婷 , 柴 方 圆 , 柏 阳 , 2011)。 研究 发 现 ， 人 们 会 直觉 地 对 诸如 用 国 
次 擦 马 桶 、 吃 掉 自 己 家 被 撞 死 的 狗 、 兄 妹 乱 伦 、 答 应 母 杀 过 分 的 遗愿 却 无 法 完成 、 和 冻 鸡 发 
生性 行为 等 事件 快速 、 直 觉 、 无 需 努 力 、 不 假 思索 地 做 出 其 不 道德 的 判断 ， 而 无 法 解释 为 何 
(Haidt, Koller, & Dias, 1993; Haidt, 2001 )。 盖 因 其 做 出 不 道德 这 种 道德 判断 之 前 产生 了 厌恶 
的 情绪 。 对 天 桥 问 题 与 列车 问题 的 解答 不 同 ， 也 因为 二 者 激活 了 不 同 区 域 的 大 脑 皮层 ， 前 者 
激活 了 更 多 与 情绪 相关 的 脑 区 (Greene, Sommerville, Nystrom, Darley, & Cohen, 2001). 
第 四 , 道德 决策 和 行动 。 道 德 决 策 与 行动 不 同 于 道德 判断 , 人 工 智能 体 知 善 恶 、 识 好 尹 、 
明 是 非 , 但 并 不 一 定 真 的 决定 与 真 的 做 出 良 善 的 行为 。 通常 情况 下 ， 人 类 做 出 道德 决策 与 行 
为 很 大 程度 上 是 基于 系统 一 思维 的 ， 甚 至 人 类 在 判断 其 他 人 是 否 道德 时 也 基于 系统 一 思维 
(Yu & Peng, 2014)。 所 谓 系统 一 思维 ， 意 指 那 些 快速 、 直 觉 、 不 费力 气 、 不 加 思索 、 情 绪 
化 的 思维 方式 ， 它 用 于 处 理 人 每 日 所 面临 的 大 部 分 、 大 量 、 扑 面 而 来 的 繁琐 信息 ; 而 系统 二 
思维 ， 意 指 那些 缓慢 、 审 慎 、 耗 费 努 力 、 仔 细 加 工 、 理 性 化 的 思维 方式 ， 它 用 于 处 理 人 在 广 
意 指向 、 空 闲 而 重要 时 的 少量 信息 (Kahneman & Egan, 2011)。 对 于 人 工 智 能 体 来 说 ， 按 现 
在 的 运行 方式 ， 其 行为 应 该 是 计算 的 结果 ， 也 就 是 说 ， 它 主要 是 基于 第 二 思维 系统 的 ， 且 更 
为 理性 。 由 于 其 能 够 处 理 的 信息 远 多 于 人 类 ， 第 二 思维 系统 不 仅 让 其 能 够 更 好 地 指导 行为 ， 


IT 


更 有 利于 设计 者 更 好 、 更 方便 地 设计 足够 第 二 思维 系统 理性 决策 的 概念 表征 系统 。 

第 五 ， 道 德 交 流 。 当 人 工 智能 体 被 赋予 道德 立场 时 ， 它 很 可 能 成 为 被 证 责 的 对 象 。 前面 
四 种 道德 能 力 的 材料 都 是 个 体 化 的 , 而 人 工 智能 的 发 展 和 其 道德 立场 的 获得 一 定 会 使 其 身 处 
社会 情境 中 。 它 会 受到 谴责 ， 也 可 能 承受 非 难 ， 它 将 要 辩护 ， 也 倾向 解释 。 但 无 论 它 在 社会 
交流 中 对 于 道德 谨 责 、 责 备 、 表 扬 还 是 赞颂 做 出 何 种 辩护 、 解 释 、 归 因 ， 它 们 都 需要 这 种 进 
行道 德 交流 的 能 力 。 道 德 交流 的 能 力 基于 前 述 四 种 材料 之 上 。 

应 该 说 ， 对 这 五 类 道德 能 力 的 细致 刻画 是 逐步 的 、 从 浅 到 深 的 、 从 个 体 到 社会 的 、 从 基 
础 到 应 用 的 。 
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(=) 人 工 智能 体 的 道德 能 力 是 否 不 同 ? 

从 上 述 道 德 能 力 的 五 种 材料 来 看 , 事实 上 人 类 也 需要 或 者 也 内 隐 地 被 设计 为 具有 这 五 种 
能 力 。 但 人 工 智能 体 的 道德 能 力 与 人 类 的 道德 能 力 相 同 吗 ? 对 这 个 问题 的 回答 如 果 是 相同 ， 
那么 我 们 就 在 假设 人 类 思维 、 情感 和 行为 的 规律 也 是 基于 底层 的 生物 计算 。 这 是 一 种 被 许多 
人 持 有 但 未 经 证 实 的 假说 。 某 种 程度 上 ,人 类 也 可 能 有 独立 于 生物 过 程 与 底层 计算 过 程 而 并 
不 由 这 些 过 程 决定 的 高 级 心理 过 程 。 但 由 于 心理 学 缺乏 宏大 理论 (Grand Theory) WF, 
忆 此 我 们 其 实 并 不 清楚 也 并 不 明白 心理 过 程 完 竟 是 如 何 铺陈 开 来 的 。 其 道德 能 力 是 否 不 同 ， 
只 能 说 很 大 程度 上 可 能 并 不 相同 。 

而 人 与 人 工 智 能 体 道德 能 力 的 获得 方式 可 能 就 完全 不 同 了 。 从 基本 原理 上 推 上 晰 ， 人 可 能 
生 而 具有 能 够 学 习 道 德 词 汇 、 形 成 道德 规范 的 语言 装置 CChomsky, 1975)， 但 是 人 的 规范 系 
统 、 道 德 词汇 系统 、 道 德 认 知 和 情感 、 道 德 决策 和 行为 、 道 德 交 流 应 该 都 是 后 天 所 习 得 的 ， 
人 具有 习 得 这 些 材 料 ， 并 将 其 运用 的 先天 能 力 ， 但 是 人 缺乏 先天 出 生 时 就 有 的 这 种 材料 。 我 
们 可 能 有 先天 转换 生成 语言 装置 , 也 可 能 有 进化 而 来 的 适用 于 学 习 这 些 材料 的 心理 基质 , 但 
是 我 们 缺少 具体 学 习 的 内 容 。 有 具体 学 习 的 内 容 必须 是 后 天 习 得 的 ， 是 经 验 性 的 。 而 人 工 智 能 
体 却 不 同 。 如 果 我 们 能 将 这 些 道德 能 力 操作 化 变 成 可 实现 的 代码 ,或 者 变 成 可 供 学 习 的 材料 ， 
那么 一 个 具体 的 人 工 智能 体 很 可 能 在 其 诞生 之 初 便 具 有 了 道德 能 力 。 但 由 于 人 工 智 能 体 是 不 
端 进 行 学 习 和 和 迭代 的 , 那么 其 所 面临 的 任务 与 环境 中 进行 的 新 的 学 习 也 能 改变 或 者 增加 ( 当 
然 也 能 减少 或 者 扭转 ) 这 种 道德 能 力 。 用 心理 学 术语 来 进行 类 比 ， 出 厂 设 置 的 道德 能 力 是 基 
于 研究 和 理论 的 ， 这 似乎 是 自 上 而 下 Cop-down) 的 道德 能 力 ， 而 后 期 经 验 性 的 习 得 ， 这 似 
乎 是 自 下 而 上 Cbotom-up) 的 道德 能 力 。 前 者 是 人 类 较 少 的 ， 因 为 人 类 在 出 生 时 不 具备 道 
德 能 力 的 内 容 ， 而 只 有 获得 道德 能 力 的 潜在 可 能 , 但 人 类 在 后 期 习 得 道德 规则 ， 进 行道 德 发 
展 后 ， 却 能 自 上 而 下 地 去 根据 道德 规则 来 进行 行为 ; 而 后 者 是 人 类 较 多 地 ， 人 类 道德 发 展 过 
程 中 所 经 历 的 从 他 律 到 自律 或 者 从 前 习俗 到 习俗 到 后 习俗 的 阶段 均 缺 不 了 自 下 而 上 的 经 验 
过 程 . 这 种 人 工 智能 体 获得 道德 能 力 方 式 上 与 人 类 的 差异 便 决定 了 给 予 人 工 智 能 体 何 种 社会 
经 验 或 者 任务 是 极端 重要 的 ,这 会 导致 其 道德 能 力 的 不 同 。 当 然 对 于 其 诞生 时 应 该 生 儿 镶 撕 
何 种 道德 的 研究 更 为 基础 ， 也 正 是 现在 研究 者 所 进行 的 。 

值得 一 提 的 是 , 经 常会 有 学 者 反 驶 说 ， 人 工 智 能 永远 无 法 获得 真 的 道德 能 力 ， 因 为 人 工 
智能 不 可 能 拥有 自我 、 意识 、 审美、 共 情 、 心 理 理论 与 观点 采 择 的 能 力 等 。 而 实际 上 , 自我 、 
意识 等 过 程 如 果 也 是 基于 神经 生物 过 程 与 计算 过 程 的 话 ,那么 人 工 智能 体 便 有 拥有 这 种 能 力 
的 可 能 。 而 审美 过 程 实际 上 与 道德 过 程 类 似 , 最 简单 都 可 以 采用 训练 集 标 注 美 丑 程度 的 方式 
轻松 让 人 工 知 能 体 习 得 。 共 情 、 心 理 理论 与 观点 采 择 则 相对 麻烦 ,这 标志 着 人 工 智能 需要 去 
用 对 方 ( 可 能 是 人 、 也 可 能 是 其 他 人 工 智 能 体 ) 的 视角 去 体会 对 方 的 想法 与 情绪 。 揣 度 他 人 
的 想法 并 不 困难 ， 人 的 察言观色 、 推 断 意 图 理论 上 都 能 用 训练 集 来 进行 学 习 ， 困 难 的 是 ， 人 
工 智能 需要 决策 是 它 需要 揣 度 到 他 人 揣 度 他 心理 过 程 的 能 力 。 我 们 都 知道 曹操 败 走 华 容 道 ， 
而 每 到 一 个 侈 道口 ,他 都 会 进行 选择 ,在 这 个 选择 中 他 必须 揣 度 诸葛 亮 是 如 何 判断 他 的 心理 ， 
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从 而 进行 抉择 。 故 事 中 的 昔 操 每 做 一 次 选择 都 会 嘲笑 孔明 少 谍 、 周 瑜 寡 智 ,但 是 每 次 诸葛 亮 
都 会 准确 地 猜 中 他 的 想法 而 对 其 进行 伏击 。 曹 操 与 诸葛 亮 的 博弈 , 在 于 其 互相 在 判断 对 方 能 
够 理解 自己 的 想法 的 程度 , 而 这 个 所 谓 的 程度 是 个 你 用 心理 理论 揣 度 我 ,而 我 用 心理 理论 揣 
度 你 揣 度 我 , 你 再 用 心理 理论 揣 度 你 揣 度 我 揣 度 你 的 无 限 过 程 。 人 工 智 能 一 定 能 无 限 运算 下 
去 ， 但 这 个 无 限 过 程 在 何 处 停止 才 真 正 标志 人 工 智 能 的 超凡 智能 。 


三 、 人 工 智 能 体 的 道德 规则 (moral norm) 

(—) 人 类 的 道德 规则 适用 吗 ? 

人 工 智 能 如 果 有 道德 能 力 ， 那 么 其 基础 便 是 道德 规范 或 者 规则 CMalle, 2014)。 而 让 其 
有 道德 规范 最 为 简单 的 方式 便 是 将 已 有 的 人 类 道德 规范 加 诸 其 身 以 对 其 进行 出 三 设置 并 
规范 其 今后 的 学 习 与 行为 。 那 么 人 类 规则 是 什么 、 如 何 适用 便 是 首当其冲 的 问题 。 
人 类 的 道德 规则 有 哪些 ?通常 情况 下 ， 人 类 倾向 于 将 规则 简约 化 , 形成 一 整套 所 谓 的 价 
直观 系统 。 价 值 观 系统 简单 地 在 比较 当 两 种 情况 相 冲 突 时 ， 人 们 看 重 (value〉 那 一 种 ， 所 
谓 价值 亦 即 重量 的 含义 。 人 类 规范 系统 或 日 价值 观 系统 通常 情况 下 有 如 下 理论 : 第 一 ， 弗 洛 
伦 斯 :克拉 克 宏 (Florence Kluckhohn) 和 弗 雷 德 . 斯 特 罗 德 贝克 (Fred Strodtbeek) 提出 了 五 
种 维度 : 人 性 ( 善 、 恶 还 是 混合 )、 人 与 外 在 环境 的 关系 (从 属 、 主 导 还 是 与 自然 和 谐 相处 )、 
人 与 他 人 的 关系 等级、 集体 平权 还 是 个 性 化 的 )、 人 的 主要 活动 模式 存在、 成 为 还 是 奉 
斗 )、 人 的 时 间 观 念 〈 看 重 过 去 、 现 在 还 是 将 来 ) (Kluckhohn & Strodtbeek, 1961)。 第 二 ， 


e A RAKRIBUNE (Gordon W. Allport) 将 人 类 的 价值 观 分 为 看 重 理论 的 、 政 治 的 、 经 济 的 、 审 
之 美的 、 社会 的 还 是 宗教 的 (Vernon & Allport, 1931). B=, 米尔 顿 : 罗 克 奇 (Milton Rokeach ) 


将 价值 观 分 为 看 重工 具 性 价值 观 〈《 有 抱负 、 心 胸 宽 广 、 有 才能 、 人 快活、 整洁 、 勇 敢 、 助 人 、 
诚实 、 富 于 想象 、 独 立 、 有 理智 、 有 人 逻辑 性 、 钟 情 、 顺 从 、 有 教养 、 负 责任 、 自 控 、 仁 慈 ) 
还 是 终极 性 价值 观 (舒适 生活 、 振奋 生 活 、 成 就 感 、 和 平 世 界 、 美 丽 世 界 、 平 等 、 家 庭 保障 、 
自由 、 幸 福 、 内 心平 静 、 成 熟 的 爱 、 国 家 安全 、 享 乐 、 灵 魂 得 到 拯救 、 自 兽 、 社 会 承认 、 真 
正 友 请 、 智 慧 ) (Rokeach, 1973). SVU, Beis AYTUR (Shalom H. Schwartz) 区 分 了 十 种 
介 值 观 ,并 将 其 分 为 了 自我 超越 (包含 普 世 与 慈善 )、 自 我 强化 (包含 权力 与 成 就 )、 保守 ( 包 
SES. EMSRS) 与 开放 (包含 自我 导向 、 刺 激 与 享乐 》 四 类 (Schwartz, 1992)。 当 然 
有 些 美德 的 分 类 通常 情况 下 也 可 能 被 视 为 价值 观 的 分 类 ， 如 马丁 : 塞 利 格 曼 (Martin E. P. 
Seligman) 和 克里斯托弗 :彼得 森 (Christopher Peterson) 的 六 种 美德 模型 : 智慧 与 知识 、 勇 
ABR, IE. TH BA (Peterson & Seligman, 2004); REHA. AF but (Richard Shweder ) 
的 自治 伦理 、 社 群 伦理 和 神 性 伦理 (Shweder & Haidt, 1993); 亦 或 是 乔纳森 : 海 特 (Jonathan 
Haidt) 的 伤害 /关怀 、 公 平 /互惠 、 内 群体 /忠诚 、 权 威 /尊敬 、 纯净 /圣洁 五 种 道德 基础 Graham, 
Nosek, Haidt, Iyer, Koleva, & Ditto, 2011)。 实 际 上 这 些 美德 或 者 道德 分 类 并 非 是 看 重 何 种 价 
值 的 定义 方式 ,将 其 看 做 价值 观 是 存疑 的 〈 喻 丰 ， 彭 凯 平 ， 董 蕊 ， 柴 方圆 ， 韩 婷 婷 , 2013). 4 
然 还 有 其 他 价值 观 的 维度 ， 比 如 文化 价值 观 〈 个 体 主 义 一 集体 主义 )、 传 统 儒家 价值 观 〈 如 
吃苦 耐劳 、 服 从 权威 、 礼 尚 往来 等 ) GSE, "E, NIBH, 2011). 

这 些 价值 观 系统 对 于 人 工 智 能 体 来 说 适用 吗 ? 实际 上 这 个 问题 非常 简单 ， 即 不 适用 。 因 
为 人 类 价值 观 系 统 是 一 种 抽象 、 尽 量 简约 化 的 系统 ,而 人 工 智 能 体 所 输入 的 必须 是 一 种 可 以 
转化 为 变量 或 者 代码 表征 的 极其 具体 的 行为 规则 。 这 种 规则 如 果 可 以 , 最 好 表述 为 如 果 .… 那 
4... Gf...then...) 形式 , 这 符合 认 知 情感 人 格 系统 (CAPS) 对 于 行为 发 生 的 定义 〈 喻 丰 ， 茧 
凯 平 ， 圩 婷 婷 , 柏 阳 ， 柴 方圆 ，2012)。 而 如 果 将 人 类 总 结 的 抽象 道德 规范 系统 转化 为 具体 的 
规则 ， 这 是 一 个 演绎 的 过 程 ， 而 具体 需要 演绎 出 多 少 特异 化 的 规则 ， 也 就 是 说 人 工 智能 学 习 
材料 中 需要 包含 究竟 何 种 程度 多 样 化 的 场景 ， 这 都 需要 探讨 。 通 常情 况 下 ， 人 工 智 能 科学 家 
面 对 这 样 的 问题 会 进行 一 个 粗略 的 估计 ， 如 李 飞 飞 等 人 在 ImageNet 中 对 于 图 片 的 人 工 标注 


数量 (320 万 张 或 者 1500 万 张 ) 这 只 是 一 个 粗略 估计 后 看 其 识别 率 变化 (Deng et al., 2009). 
图 片 容 易 获 得 ,而 道德 情境 缺 很 难 编制 或 者 估计 其 数量 。 一 个 可 能 的 途径 是 使 用 近期 心理 学 
对 情境 的 分 类 模型 (Rauthmann et aL, 2014)〉 重 新 对 道德 情境 i 学 、 编 制 、 提 取 
特征 等 过 程 来 制作 人 工 智 能 学 习 材 料 。 
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(=) 如 何 解 决 道 德 规则 冲突 ? 
段 使 我 们 能 够 通过 上 述 方式 获得 可 能 的 具体 的 道德 规范 , 那么 这 些 道德 规范 是 普遍 适用 
的 吗 ? 实 际 上 , 道德 规范 当然 有 普遍 的 可 能 , 但 是 即使 是 人 类 社会 ,也 存在 道德 规范 之 间 的 
相互 冲突 。 对 自动 驾驶 汽车 道德 规则 的 选取 已 然 证 明了 文化 甚至 是 性 别 差异 (Awad et al., 
2018)。 有 些 文化 中 ， 女 性 被 人 看 到 会 被 认为 是 不 道德 的 事情 ， 被 人 强奸 则 父兄 还 会 将 其 杀 
死 ， 这 对 于 我 们 看 来 不 可 思议 (Fiske & Rai, 2014)。 如 果 你 是 一 个 伴郎 但 是 钱包 被 偷 无 法 买 
票 ， 你 急 着 赶 去 婚礼 送 戒指 ， 这 个 时 候 在 火车 站 有 一 个 偷 他 人 钱包 买 票 的 机 会 ， 应 不 应 该 偷 
WE? 美国 人 大 多 数 觉得 不 应 该 偷 ， 而 印度 人 大 多 数 觉 得 应 该 偷 (Miller & Bersoff, 1992). B] 
使 在 同一 种 文化 内 ,道德 规则 也 可 能 产生 冲突 。 如 在 狭路相逢 被 他 人 言语 侮辱 时 ， 美 国 南方 
人 比 北 方 人 的 反应 要 表现 出 更 多 的 攻击 性 , 这 是 由 于 美国 南方 的 荣誉 文化 所 致 (Cohen et al., 
1996)。 

但 是 我 们 试想 , 一 个 身 处 印度 和 身 处 美国 的 人 工 智 能 体 , 如 果 由 同一 家 公司 采用 同一 种 
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c. 基础 的 人 工 智能 训练 集 和 代码 , 那么 对 于 类 似 上 述 是 否 该 偷 钱 的 情境 , 其 表现 必然 是 相同 的 。 
e 且 不 说 其 行为 最 终 是 偷 亦 或 是 不 偷 , 这 种 相同 合理 吗 ? 这 个 问题 的 回答 应 该 对 于 不 同 的 人 工 
e ?能 体 来 回答 。 笔 者 认为 ， 如 若 人 工 智 能 体 仅 仅 是 完成 菜 项 单独 任务 ， 那 么 无 须 考虑 类 似 文 


化 差异 问题 。 但 如 果 人 工 智能 体 具有 了 社会 规则 , 那么 其 本 身 便 带 有 社会 文化 背景 在 进行 行 
为 ， 当 然 也 包括 道德 行为 。 从 这 个 意义 上 说 ， 如 果 要 让 人 类 舒适 ， 则 在 不 同文 化 中 使 用 的 人 
工 智能 体 必 须 使 用 所 处 文化 的 训练 材料 来 进行 学 习 ， 正 如 上 述 我 们 所 说 ， 哪 怕 是 道德 批判 ， 
中 文 和 英文 的 词汇 在 意义 和 结构 上 都 不 尽 相 同 。 同 时 ， 处 于 不 同文 化 中 的 人 工 智 能 体 其 先 在 
道德 假设 也 应 符合 其 所 处 的 文化 。 在 上 述 例子 中 ,美国 机 器 人 如 果 做 出 偷 的 行为 ， 印 度 机 器 
人 如 果 做 出 不 偷 的 决策 ， 这 似乎 在 其 所 处 的 文化 中 都 不 能 称 作 道德 。 

此 时 我 们 便 还 能 考虑 另 一 种 解决 方案 , 即 人 工 智 能 体 或 者 机 器 人 是 否 可 以 有 双语 甚至 具 
= 有 双语 所 代表 的 双 文 化 规则 ? 由 于 人 工 智能 体现 在 还 缺乏 自我 和 意识 , 因此 其 双 文 化 道德 规 
则 系统 或 者 更 多 文化 规则 系统 也 许 都 是 可 以 实现 的 ,只 是 用 两 个 训练 集 分 别 训 练 两 个 人 工 智 
能 代码 而 存储 在 同一 个 实体 中 即 可 。 但 是 如 果 人 工 智能 在 将 来 有 了 自我 认同 , 那么 这 种 情况 
是 否 还 能 出 现 ? 人 工 智能 体 是 否 能 够 双 文 化 切换 是否 能 够 同时 容忍 两 种 不 同 的 道德 价值 存 
在 这 都 是 需要 思考 和 探索 ， 而 现今 并 无 答案 的 问题 。 

当然 还 有 男 一 种 可 能 性 , 即 人 工 智能 体 无 法 同时 容忍 两 种 不 同 的 道德 价值 存在 ,也 就 是 
说 人 工 智能 体 拒绝 道德 相对 主义 存在 的 可 能 。 那 么 在 这 样 的 情况 下 ,人 工 智 能 体 有 可 能 促进 
一 种 所 谓 的 普 世 价值 ， 它 促使 文化 融合 ， 也 促使 全 球 化 的 状况 加 剧 〈Yu et ab, 2016). Ke 
否 是 一 件 好 事 值 得 讨论 ， 但 也 不 失 为 一 种 可 能 性 。 
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(=) 人 工 智能 体 道德 规则 如 何 习 得 ? 

假使 我 们 已 然 获 得 了 大 量 可 被 表征 的 具体 道德 规范 , 也 解决 不 同文 化 社会 情境 下 
道德 规范 冲突 的 解决 方案 , 那么 我 们 是 否 就 可 能 造 出 道德 人 体 了 呢 ? 事实 上 也 并 不 那 
么 简单 。 首 先 ,我 们 必须 有 一 个 高 度 具 体 化 和 结构 化 的 道德 情境 训练 集 ， 而 这 个 训练 集 是 能 
够 避免 不 同 社会 文化 情境 中 道德 规范 之 间 相 互 冲突 的 。 以 这 个 道德 情境 训练 材料 作为 局 示 点 
的 人 工 智能 , 还 应 被 施加 许多 理论 钦定 的 道德 规则 。 这 样 工 智能 体 在 其 诞生 之 初 便 
有 了 很 好 的 道德 能 力 、 尤 其 是 指导 其 行为 的 规范 。 但 这 只 由 自 上 而 下 加 工 所 产生 的 
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最 初 道德 人 工 智 能 体 。 

这 些 道德 人 工 智能 体 不 可 避免 地 最 终 会 接触 形形色色 的 人 与 光怪陆离 的 社会 现象 , 它 可 
自 下 而 上 地 习 得 新 的 规则 。 如 何 避 免 其 习 得 人 类 并 不 喜欢 的 道德 规则 ? 似乎 至 少 有 三 种 
可 以 选择 : 其 一 是 ， 这 些 道德 人 工 智能 体 已 经 在 诞生 之 初 便 学 习 得 特别 顺畅 ， 已 然 具 有 
了 明辨是非 的 能 力 《〈 类 似 其 知道 选择 何事 可 为 、 何 事 不 可 为 ， 也 知道 为 何 )， 我 们 无 需 担心 
其 之 后 的 学 习 过 程 ， 因 为 它 可 以 在 学 习 过 后 弃 恶 存 善 。 其 二 是 ， 这些 道德 人 工 智 能 体 在 诞 
之 初 已 然 学 习 了 什么 是 好 、 什 么 是 坏 , 但 是 人 类 依然 对 其 存疑 , 我 们 限制 其 今后 进行 训练 
代 的 材料 ， 制 定 一 套 专门 挑选 日 后 迭代 训练 材料 的 规则 《类 似 让 其 选择 何事 可 为 、 何 事 不 
为 , 而 不 告诉 其 为 何 ), 让 其 主动 (当然 是 规则 所 定 ) 选择 何 合适 的 而 向 善 的 迭代 学 习 材 料 ， 
主动 放弃 可 能 会 习 得 作 有 恶 的 迭代 学 习 材 料 。 其 三 是 ， 训 练 一 种 可 能 的 自我 控制 能 力 
(Baumeister, Vohs, & Tice, 2007)， 来 约束 人 工 智能 体 自己 。 从 很 多 意义 上 来 说 ， 能 够 观察 
学 习 、 自 我 调节 和 控制 也 许 是 人 类 最 为 伟大 的 、 体 现 自 己 自 由 意志 和 能 动 性 的 行为 了 ， 正 是 
这 种 特性 造就 了 人 类 荣耀 ORE, HALF, 2018)。 而 第 三 种 方式 可 能 是 人 工 智 能 真正 成 为 人 
并 超越 人 的 存在 方式 ， 况 且 ， 这 种 自我 调节 还 不 能 失败 ， 这 是 必须 要 面 对 的 问题 。 
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四 、 人 工 智 能 体 的 道德 理解 (moral understanding) 
(—) 人 工 智能 体会 被 人 当成 人 吗 ? 

人 类 有 一 种 倾向 , 即 对 于 无 法 理解 的 事物 , 我们 倾向 于 使 用 能 够 理解 的 方式 去 扭曲 这 种 
事物 , 将 其 变 为 人 类 社会 中 存在 的 事物 与 现象 来 理解 之 .如 果 我 们 不 知道 人 工 智能 是 何 物体 ， 
那么 我 们 倾向 于 将 其 作为 人 看 。 这 便 是 拟人 化 〈Anthropomorphism)。 它 是 一 种 将 人 类 独 有 
特质 赋予 非 人 实体 的 倾向 性 或 形态 (Epley, Waytz, & Cacioppo, 2007; YWA, IME, AIE, 
韩 婷 婷 ， 赵 靓 , 2017)。 人 工 智 能 通常 情况 下 以 拟人 化 的 姿态 出 现 ， 人 们 也 倾向 于 将 拟人 化 的 
机 器 看 做 人 工 智能 体 。 璧 如 在 街 上 随处 可 见 所 谓 的 拉面 机 器 人 , 这 种 拉面 机 器 实际 上 并 非 人 
工 智 能 , 而 只 是 普通 机 器 , 但 是 由 于 其 人 形 形 象 的 存在 , 它 通 常情 况 下 会 被 认为 是 人 工 智能 。 
而 真实 的 人 工 智 能 做 饭 或 者 炒菜 的 机 器 ， 由 于 其 形态 类 似 机 器 ， 而 并 无 人 形 特征 ,在 生活 中 
种 人 却 不 会 将 其 看 做 人 工 智能 ， 知 识 匮乏 者 甚至 无 法 理解 这 是 人 工 智 能 的 实体 存在 〈 喻 丰 ， 
许 丽 颗 , In Press)。 甚 至 普通 人 开始 制造 其 所 谓 的 人 工 智 能 时 ， 均 会 选择 拟人 化 的 形态 而 开 
始 (Broadbent, 2017)。 

可 人 将 人 工 智 能 看 做 一 种 新 的 物种 , 有 人 认为 人 工 智能 不 足 为 惧 , 开玩笑 言 无 非 拔 掉 电 
源 。 这 都 是 在 指称 人 工 智 能 的 非 生物 有 机 体 特性 。 但 是 这 种 有 机 体 特 性 并 不 影响 其 拟人 。 人 
有 将 人 工 智 能 拟人 化 的 倾向 ， 人 工 智能 也 不 可 能 不 类 似 于 人 。 它 是 由 人 类 创造 且 在 创造 之 初 
便 模仿 人 类 的 智能 体 , 即使 其 智能 再 过 超群 , 它 身 上 不 可 避免 也 有 当初 人 类 创造 它 并 让 其 模 
仿 人 类 的 特征 。 至 少 在 认识 论 层面 上 , 这 个 时 代 我 们 将 其 看 做 一 种 介 于 机 器 与 人 之 间 的 人 性 
不 够 的 人 或 者 是 具有 某 些 人 性 的 机 器 , 因为 它 可 能 在 人 类 知觉 上 具有 了 某 些 人 性 或 者 人 类 独 
特性 特征 〈Haslam，2006)。 或 许 在 今后 的 某 个 阶段 ， 人 工 智 能 体会 被 看 做 超人 ， 即 在 某 些 
特性 上 它 超过 了 人 类 。 但 无 论 是 低 人 、 非 人 还 是 超人 ， 人 工 智 能 体 都 始终 被 人 当做 类 似 于 人 
来 看 待 ， 同 样 人 类 道德 认 知 的 方式 ， 某 种 程度 上 在 人 工 智 能 体 上 还 起 作用 。 
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(=) 人 工 智能 体会 改变 人 类 关系 吗 ? 

拟人 化 的 人 工 智 能 体 ， 如 机 器 人 确实 能 够 与 人 建立 起 社会 联系 〈 如 陪伴 机 器 人 、 人 性爱 机 
器 人 与 人 之 间 必 然 能 够 建立 社会 心理 联结 )， 但 是 这 种 联系 是 否 真 的 是 社会 关系 是 存疑 的 
(Damiano & Dumouchel, 2018)。 因 为 拟人 化 的 机 器 人 毕竟 不 是 人 ， 这 种 人 与 非 人 的 关系 只 
是 拟人 化 外 表 赋 予 人 与 算法 之 间 建 立 的 关系 ， 究 其 实质 ,这 种 关系 是 虚伪 和 欺骗 甚至 自我 其 
骗 的 关系 。 长 久 沉浸 的 与 拟人 化 机 器 人 建立 起 的 关系 , 这 甚至 会 反而 影响 人 类 真实 的 社会 关 


A ORE, HINA, In Press). 

但 是 人 工 智 能 也 许 能 够 改变 广义 上 人 与 物 之 间 的 关系 。 道 德 , 尤其 是 中 国 传 统 道德 最 重 
要 的 就 是 体现 人 与 人 关系 的 调节 功用 。 而 人 工 智 能 体 的 出 现 ， 让 人 对 待机 器 ,尤其 是 对 竺 具 
有 道德 立场 的 机 器 产生 了 极 大 的 变化 。 普 通 民 众 实 际 上 对 普通 机 器 的 道德 考量 远 逊 于 动物 ， 
寻 为 前 者 缺乏 人 性 和 人 类 独特 性 ,而 后 者 只 是 缺乏 人 类 独特 性 而 已 (Haslam, 20060. 至 少 ， 
人 们 在 普遍 认识 上 认为 在 非 人 与 人 的 直线 上 ,机 器 不 如 动物 。 但 是 当 人 工 智能 兴起 之 后 ， 这 
种 关系 是 否 会 变化 ， 关系 之 间 的 意义 是 否 会 随 之 变化 , 而 其 带 来 的 道德 后 果 会 将 如 何 , 现在 
做 结论 还 为 时 尚 早 。 


(=) 人 工 智能 体能 个 性 化 吗 ? 
一 个 有 趣 的 事实 是 ， 人 工 智 能 在 训练 之 后 批量 生产 投入 使 用 之 前 必然 是 普遍 一 般 化 的 。 
举例 来 说 ， 自 动 驾驶 汽车 在 出 三 时 必然 是 一 样 的 。 但 如 果 其 具有 学 习 功 能 ,那么 不 同 驾驶 员 
如 果 在 自动 驾驶 的 同时 还 进行 手动 驾驶 , 那么 不 同 驾 驶 员 的 驾驶 习惯 便 会 成 为 自动 驾驶 汽车 
自动 学 习 的 材料 ,这样 自动 驾驶 汽车 便 可 能 在 出 三 后 不 就 变 得 极 具 个 性 化 ， 如果 道路 上 均 采 
用 的 是 自动 驾驶 汽车 的 话 , 那么 似乎 除了 人 类 无 需 付 出 驾驶 劳动 之 外 , 道路 状况 与 驾驶 情境 
> 和 之 前 并 无 本 质 区 别 。 基 于 个 体 大 数据 的 学 习 会 使 得 人 工 智能 变 得 高 度 个 性 化 , 这 反而 给 人 
工 智 能 体 提供 了 一 个 信息 昔 房 〈 喻 丰 , HIF, 郑 先 售 , 2015). 
这 种 个 性 化 是 好 事 吗 ? 理论 上 来 说 , 现在 的 人 工 智 能 模拟 的 是 人 类 的 平均 数 , 正如 心理 
学 研究 的 是 人 的 心理 过 程 和 行为 的 平均 数 规律 一 样 。 以 前 述 ImageNet 为 例 ， 实 际 上 人 工 智 
能 进行 学 习 的 材料 靠 的 是 人 工 标注 , 而 人 工 标 注 在 这 种 图 片 识别 的 简单 任务 上 都 必然 不 大 可 
能 每 个 人 一 样 ， 更 亿 论 更 加 相对 主义 一 些 的 道德 了 〔 喻 丰 ,， 韩 婷 婷 ,，2018)。 值 得 注意 的 是 ， 
模拟 的 平均 数 实际 上 并 不 一 定 是 普 裔 规律 ， 因 为 平均 数 实际 上 并 不 能 适用 于 每 个 个 体 , 也许 
没有 一 个 个 体 刚好 是 平均 数 , 但 个 体 们 的 集合 造就 了 平均 数 。 我 们 讨论 的 道德 规范 和 道德 能 
力 并 非 是 平均 数 规律 ， 而 是 普遍 规律 。 因 此 人 工 智 能 道德 研究 ,存在 一 个 从 平均 数 规律 向 普 
遍 规律 过 湾 的 阶段 。 平 均 数 规律 靠 人 工 评定 和 计算 便 能 够 由 科学 家 较为 轻松 地 建立 ,而 普遍 
规律 则 更 需要 人 文 社 科学 者 的 参与 制定 ,所 以 从 平均 数 规律 向 普遍 规律 的 过 渡 正 是 人 工 智 能 
从 纯 自 然 科 学 向 包括 人 文 社 科 在 内 的 多 学 科 交 又 融 合 、 以 人 为 中 心 (human-centered) 的 过 
程 。 在 这 个 过 程 中 ,可 以 预计 的 是 以 人 类 认 知 为 中 心 、 嵌 入 社会 情境 的 社会 心理 学 将 发 挥 重 
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